Traduire en francais le lexique du patrimoine 
artistique de la ville de Bologne : le sous-corpus 
comparable BER du projet LBC 


Valeria Zotti 


1. Introduction 


Dans cette contribution, nous illustrerons une nouvelle phase du projet de 
recherche interuniversitaire Lessico plurilingue dei Beni Culturali (LBC) qui porte 
sur l’élargissement du corpus LBC Français! avec l’ajout d’un sous-corpus sur 
la ville de Bologne et surla région Émilie-Romagne (Cetro, Zotti 2020, 88). Ce 
sous-corpus a été réalisé par une antenne de l’équipe LBC?, l’unité de recherche 
LBC-CeSLicC de l’Université de Bologne’, dans le cadre de deux projets de re- 
cherche financés : le premier, UniCittà. Riscoprire Bologna attraverso l’Alma Ma- 
ter (UniCité. Redécouvrir Bologne à travers son Université), a été financé par 
la fondation Carisbo dans le cadre de l’appel à projets Riscoprire la città, au cou- 
rant des années 2019-2021 ; le second, UniVOCIttà: Voci digitali sull’unicità del 
patrimonio bolognese (UniVOCité. Voix numériques surl’unicité du patrimoine 
bolonais) vient d’être sélectionné par l’Université de Bologne parmiles projets 
de recherche explorant des thèmes de pertinence interdisciplinaire pour le Pro- 
gramme national de recherche italien (PNR). 


1 Consultable en libre accès sur : http://corpora.lessicobeniculturali.net/ (22/12/2022). 

Cf. le site web du projet LBC : https://www.lessicobeniculturali.net/fr/contenuti/l-équipe 

(22/12/2022). 

3 Née en mars 2018 au sein du CeSLiC (Centro di Studi Linguistico-Culturali) dans le but de 
formaliser le travail accompli au sein du projet LBC florentin. 
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Dansla première partie de cette contribution, nous présenteronsles finalités 
de ces deux projets, en nous arrétant à la fois sur leurs spécificités et sur la com- 
posante de continuité avec les objectifs poursuivis par le projet LBC. Comme 
l’a affirmé Annick Farina dans une étude récente (Farina, Sini 2020, 77-78), le 
projet LBC, né comme description plurilingue du patrimoine florentin, élargit 
désormais son horizon et s'ouvre à la description du patrimoine artistique ita- 
lien, grâce au travail accompli, dans un premier temps, par l’équipe bolonaise. 

Dans la seconde partie, nous présenterons le produit de ce travail, à savoir le 
sous-corpus Bologne et Émilie-Romagne (dorénavant BER) en son état actuel. Nous 
illustrerons son contenu tant sur le plan quantitatif (nombre de textes et de mots) 
que sur le plan qualitatif (nature des textes, sujets et aires géographiques couverts, 
données lexico-terminologiques), en nous appuyant sur la méthodologie offerte par 
la linguistique de corpus. Nous essayerons de montrer, dans une perspective plus 
large, quel sera l'apport de ce sous-corpus pour compléter la description de la ter- 
minologie artistique donnée par le corpus monolingue LBC Français. 

Dans la troisième partie, nous nous pencherons sur les applications et les ré- 
sultats fournis par la méthode d’analyse choisie. Nous montrerons dans quelle 
mesure l'approche adoptée (corpus-driven) permet de « faire émerger de ma- 
nière inductive des savoirs linguistiques > (Williams 2005: 13), concernant 
notamment le phénomène de la synonymie (diastratique et diatopique) en ter- 
minologie (arcades / portiques / galerie / loge), ainsi que de suggérer de nouvelles 
stratégies pour la traduction de termes désignant des réalités culturo-spécifiques 
(portiques) qui ne sont pas prises en compte dans les ressources plurilingues ac- 
tuellement disponibles. Cette réflexion sur l'apport des corpus pour la traduc- 
tion de la terminologie artistique, qui ne s'appuie ici que sur l'exploration des 
corpus monolingues comparables LBC, sera complétée, dans la prochaine étape 
de notre recherche, par l’analyse des bases parallèles de traduction de l'italien 
vers le français et vers l’anglais des Vies de Vasari”, que nous évoquerons à la fin. 


2. Le projet LBC et les projets dérivés UniCittà et UniVOClttà 


Le projet de recherche Lessico plurilingue dei Beni Culturali est né en 2013 
au sein du département de Langues, Littérature et d'Études Interculturelles de 
l’Université de Florence, pour répondre à l'urgence, perçue par Annick Farina et 
Marcello Garzaniti, de fournir aux professionnels de l’art des ressources fiables 
pour la description plurilingue du riche patrimoine artistique florentin et toscan‘. 


«Questi dizionari, come i corpora che li alimentano [...] nascono per consentire sia a un 
pubblico specializzato che a un pubblico più ampio di svolgere ricerche, qualitative e quan- 
titative, sul patrimonio artistico delle città di Firenze e della Toscana e, in una seconda fase, 
del patrimonio artistico italiano». 

Travail en cours sous la supervision de Daniel Henkel et de l’auteure de la présente contribution. 
Pour des informations détaillées et une description complète du projet LBC, voir la page web 
consacrée sur http://www.lessicobeniculturali.net/contenuti/il-progetto/818 (22/12/2022), 
ainsi que les nombreuses publications dans la collection « Lessico Multilingue dei Beni 
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À partir de ce projet interuniversitaire, dans lequel plusieurs chercheurs de 
l’Université de Bologne se sont engagés dès son origine, deux projets satellites se 
sont développés : le premier, UniCittà. Riscoprire Bologna attraverso l’Alma Ma- 
ter’, financé entre 2019 et 2021 par la Fondation Cassa di Risparmio di Bologna, 
porte sur la valorisation du patrimoine matériel et immatériel de l’Alma Mater 
de Bologne, l’Université la plus ancienne d'Europe ; le second, UniVOCIttà: Voci 
digitali sull’unicità del patrimonio bolognese, qui en est la continuation naturelle, 
vient de recevoir un financement pour une durée de 18 mois (juillet 2022-dé- 
cembre 2023) par l’Université de Bologne dans le cadre du programme de fi- 
nancements Almaldea, et a pour but de s'ouvrir à la description du patrimoine 
de toute la ville de Bologne et de sa région. 

Dans les deux projets bolonais, sous l’égide du projet LBC, le plan de travail 
et la méthodologie adoptée suivent en grande partie ceux du projet LBC en ce 
qui concerne la collecte et la numérisation de textes pour les trois typologies tex- 
tuelles identifiées par les concepteurs du projet (Billero 2020 ; Farina, Nicolas 
Martinez 2020). Les finalités coïncident aussi, étant donné que ces deux pro- 
jets dérivés visent la valorisation du patrimoine local. Dans le premier cas (Uni- 
Città), on s'intéresse à l’immense capital artistique immobilier (bibliothèques, 
églises, musées universitaires, instituts religieux, jardin botanique, etc.) et mo- 
bilier (collections muséales etlibraires, archives historiques, etc.), accumulé par 
l’Université de Bologne au cours des siècles depuis sa fondation en 1088 (Pe- 
rotto, Zotti 2022). Dans le second cas (UniVOCIttà), c'est la richesse artistique 
et culturelle de la ville de Bologne, composée de monuments, musées et palais 
historiques, moins célèbres dans les circuits touristiques traditionnels, qui est 
mise en valeur, ainsi que le précieux patrimoine naturel de ses alentours et de 
toute la région qui, quant à lui, mérite d’être préservé‘. 

Ces deux projets ne se distinguent de LBC que surle plan des produits finaux 
envisagés. Ils répondent à l'objectif, sollicité parles organismes de financement, 
de ‘troisième mission’ de l’Université, communément appelé « service à la socié- 
té >. C’est la raison pour laquelle ces deux produits s'adressent surtout au grand 
public et à l’industrie du tourisme et moins à un public spécialisé de linguistes. 

Le produit final du projet UniCittà est la base de données textuelles homo- 
nyme Corpus UniCittà?, qui permet d’obtenir des fragments de textes de lon- 
gueur variable en quatre langues (anglais, espagnol, français et russe), décrivant 
le patrimoine de l’Université du point de vue des voyageurs étrangers du pas- 
sé. Ces fragments ont été étiquetés avec des mots-clés correspondant à des ca- 
tégories thématiques à l’aide de Atlas.ti, un logiciel performant pour l’analyse 


Culturali > chez l'éditeur Firenze University Press : https://books.fupress.com/scienti- 
fic-board/lessico-multilingue-dei-beni-culturali/67 (22/12/2022). 
7 Voirle site web du projet UniCittà: https://site.unibo.it/unicitta/it (22/12/2022). 
Nous pensons par exemple aux chemins reliant Bologne et Florence sur les Apennins, 
comme le célèbre Chemin des Dieux. 


? Disponible sur https://corpusunicitta.it/ (22/12/2022). 
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qualitative des données textuelles, comme l’a observé Williams (2020 : 200). 
L'objectif, ici, est de fournir du matériel documentaire aux opérateurs touris- 
tiques, en particulier aux commissaires d'expositions, et aux organisateurs de 
visites guidées!!. Ce matériel offrirait aux visiteurs d'aujourd'hui le regard des 
illustres visiteurs étrangers du passé (souvent des hommes et femmes de lettres 
et de sciences venus étudier ou enseigner à l’Université de Bologne) sur le pa- 
trimoine universitaire”. 

Le projet UniVOCIttà, en cours, se propose d'élargir le champ d’applica- 
tion du projet précédent, en recueillant les “voix” qui attestent de l’unicité du 
patrimoine de Bologne et de l’Émilie-Romagne, en termes d’exceptionnalité et 
d’altérité par rapport à un regard étranger". Ce projet répond à différents défis 
posés par le PNR 2021-2027 : l'objectif est de promouvoir une synergie entre les 
compétences scientifiques, l’ innovation technologique et le système productif, 
en l'occurrence le secteur du tourisme culturel, en impliquant les régions, ainsi 
que de développer des technologies pour soutenir le patrimoine culturel moins 
connu et de participer à sa conservation et valorisation par la numérisation afin 
d’en favoriser une large accessibilité. 

Dansle cadre de ce projet, l’unité de recherche LBC-CeSLiC du Département 
de Langues, Littératures et Cultures Étrangères de l’Université de Bologne, en 
collaboration avec le Département d’Informatique de la même Université, en- 
visage la création d’un site web mobile réactif, pouvant favoriser la promotion 
du tourisme patrimonial de la ville de Bologne et de sa région. Ce système, dé- 
veloppé par un ingénieur informatique qui bénéficiera d’une allocation de re- 
cherche d’une durée de 12 mois (début : 1” janvier 2023), sous la supervision du 
professeur Fabio Vitali, expert dans la conception de vocabulaires sémantiques 
pour l’annotation de documents textuels et d’oeuvres littéraires, sera en mesure 
de générer des visualisations dynamiques des fragments du corpus textuel, met- 
tant en évidence les interconnexions linguistiques, culturelles et sémantiques. 
Les résultats seront présentés sous forme de cartes numériques géo-référencées 
qui pourront être facilement explorées et analysées par différents types d’utili- 
sateurs, dont les visiteurs. 


« Atlas.ti provides a useful means of analysing a text and extracting key information >» 
(Williams 2020 : 200). 

Comme celle proposée par le Museo della Storia di Bologna qui porte sur l’importance de 
l’Université dans l’économie de la ville. Cf. site web du musée : https://www.bolognawelco- 
me.com/it/luoghi/musei-e-gallerie-darte/palazzo-pepoli-museo-della-storia-di-bologna 
(22/12/2022). 

L'exemple souvent donné pendant les activités de dissémination dans les écoles et dans les 
bibliothèques publiques de la ville qui ont été déjà réalisées au cours de la période 2019- 
2021 est celui des deux tours de Bologne. Vues des hauteurs voisines les deux tours sont 
tantôt aimées et comparées aux mâts d’un vaisseau immense, par Joseph Louis Théodore 
Moyne, tantôt détestées comme par Charles Dickens. 

À titre d'exemple, les descriptions suggestives de la perception des portiques de Bologne par 
d’autres regards étrangers apportent un éclairage inédit pour la promotion de ce patrimoine 
de l'Unesco (cf. A. Robida, Les vieilles villes d'Italie: notes et souvenirs, 1878). 
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Bien que l’activité en aval de création de ces deux produits se distancie for- 
cément de la méthodologie de LBC'* pour ce qui relève des dernières phases 
(étiquetage sémantique, géolocalisation, modalité de navigation, types d’utili- 
sateurs, etc.), tout le travail en amont de collecte, numérisation et catégorisation 
des textes correspond exactement au projet LBC. Il est donc prévu que le projet 
UniVOCiIttà s'adresse aussi à la communauté scientifique de linguistes, et que 
cette expérience d’humanités numériques alimente l’élargissement du corpus 
LBC et converge dans la création d’un sous-corpus textuel plurilingue sur Bo- 
logne etl’ Émilie-Romagne prochainement intégré dans le corpus LBC Français. 
Un grand nombre de textes a été déjà collecté dans le cadre du premier projet 
sur l’Université de Bologne au cours des années 2019-2021 et l'objectif d’Uni- 
VOCIttà est d'élargir le corpus pour chaque langue concernée. 

Dans la prochaine section, nous présenterons le sous-corpus Bologne et Émi- 
lie-Romagne en son état actuel. Nous illustrerons les critères adoptés pour sa 
constitution et son contenu, sur le plan quantitatif et qualitatif, en nous appuyant 
sur les données extraites au moyen de l'outil d'exploration de corpus textuels 
Sketch Engine. Nous évoquerons aussi quel sera l’apport de ce sous-corpus pour 
l'élargissement et le rééquilibrage futurs du corpus monolingue LBC Français. 


3. Présentation du sous-corpus BER et complémentarité avec le corpus LBC 


Le sous-corpus BER a été réalisé sous notre supervision par l'équipe LBC- 
CeSLiC, composée de cinq chercheurs travaillant sur quatre langues étrangères!“ 
avec la collaboration de plusieurs étudiants-stagiaires!° qui se sont occupés, dans 
une première phase, de la recherche des ouvrages, de leur conversion en version 
électronique et de leur mise au propre pour rendre les documents analysables par 
les logiciels de TAL utilisés. Un travail de lecture important a été ensuite effectué 
par les stagiaires pour l'analyse du contenu des textes et leur étiquetage selon des 
critères sémantiques à l'aide du logiciel Atlas.ti. Bien que l'étiquetage ait été orienté 
vers la constitution de la base UniCittà, cette lecture approfondie s'est avérée très 
utile aussi pour la catégorisation des différents types de textes. Comme pour tous 
les corpus comparables LBC, les textes ont été choisis en fonction de leur impor- 
tance historico-culturelle, de leur diffusion au niveau international et du prestige 
accordé au patrimoine culturel italien (cf. Billero, Martinez 2018 : 208). L'équipe 
a donc privilégié la qualité des données plutôt que leur quantité, étant donné que, 


De fait, des projets annexes ont aussi été entamés par l’équipe LBC de l’Université de 
Florence en utilisant les ressources LBC, comme le travail en collaboration avec la biblio- 
thèque de Sciences Sociales de l’Université de Florence, en cours, pour créer ou compléter 
les fiches Wikidata relatives œuvres d’art (français/italien) et mettre en place leur géoloca- 
lisation, en utilisant les traductions de Vasari comme source de référence. 

Ana Pano Alamán pour l'espagnol, Monica Turci et Antonella Luporini pour l'anglais, 
Monica Perotto pour le russe et Valeria Zotti pour le français. 

Pour la langue française : Alice Curti, Francesca Faccioli, Aurora Ghelli, Valentina Toia, 
Matilde Signorelli, Carlo Garavaglia et Martina Izzi. 
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contrairement aux corpus de langue générale, la dimension d’un corpus com- 
parable spécialisé n’est pas proportionnelle à sa qualité (Friginal, Hardy 2014). 


3.1. Critères de constitution et données quantitatives et qualitatives 


La recherche des textes a reposé principalement sur la consultation d’une an- 
thologie italienne qui recense minutieusement les références bibliographiques 
des récits et témoignages de voyageurs en Émilie et en Romagne au XVIII siècle : 
Viaggi e viaggiatori del Settecento in Emilia e in Romagna (Cusatelli 1986). La plu- 
part des textes libres de droits d'auteur ont été ensuite repérés dans les princi- 
pales bibliothèques numériques en accès libre (Gallica, Wikisource), alors que les 
textes Les plus récents ont été repris des plateformes de diffusion de publications 
scientifiques (Persée, Érudit), de sites web et blogues de tourisme et de la presse 
en ligne. Dans quelques cas, des œuvres disponibles en format papier ont été nu- 
mérisées avec un convertisseur OCR et post-traitées manuellement pour corriger 
les éventuelles erreurs générées par ce système”. Tous les textes du corpus ont 
été ainsi convertis au format .doc et .txt pour qu'ils soient analysables, à ce stade, 
sur Sketch Engine, en vue de leur future intégration dans NoSketchEngine, le logi- 
ciel de gestion des corpus utilisé pour le projet LBC (cf. Billero 2020 : 29-30). 

Le sous-corpus BER Français, qui a été collecté au cours du projet UniCittà, 
afin d'extraire les fragments concernant la description du patrimoine de l’Uni- 
versité de Bologne consultables dans la base de données <corpusunicittà.it>, est 
constitué à l’heure actuelle (juillet 2022) de 201 textes, tous rédigés en français 
langue originale (aucune traduction), pour un total de plus de 600 000 tokens, 
répartis de la manière suivante pour chaque typologie textuelle (Fig. 1) : 


TEC 
8% 


LETI 
80% 


Fig. 1 Pourcentage de tokens par typologie textuelle dans le corpus BER Fr. 


17 Le post-traitement par reconnaissance optique de caractères (OCR) implique des étapes de 
nettoyage des données pour les documents qui ont été numérisés. Une étape de ce processus 
est l’identification et la correction des fautes d'orthographe et de grammaire générées en 
raison des défauts du système OCR. 
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Tab. 1. Données quantitatives du corpus BER Fr par rapport au Corpus LBC Fr. 


Corpus n.doc. tokens words % words words % words BER> 
BER BER BER BER BER LBC LBC LBCFR 
DIV 69 71269 60887 11,74% 346148 10,92% +192% 
LET 98 483587 413856 7986% 1847208 58,35%  +13,07 % 
TEC 34 49 870 43 475 8,38 % 259009 8,42% + 1,37% 
DIZ - - - - 704622 22,26% - 

Total 201 604726 518218 100 % 3164995 100% + 16,36 % 


Le tableau 1 montre que le pourcentage de words (c’est-à-dire des tokens qui 
commencent par une lettre de l’alphabet sur SketchEngine) de chaque catégorie 
textuelle sur la totalité du sous-corpus BER correspond au pourcentage de words 
pour la même catégorie dans le corpus LBC (ex. 11,74% DIV dans BER = 10,92% 
DIV dans LBC FR). L’accroissement dû au sous-corpus BER au sein du corpus LBC 
Frangais est, à l’état actuel, de 16% de words au total (cf. la dernière colonne du ta- 
bleau 1). L'objectif est d’élargir BER dans le cadre du nouveau projet UniVOCIttà 
et d’atteindre le chiffre d’au moins 800 000 tokens d’ici la fin du mois de décembre 
2022, ce qui correspondra finalement à un accroissement du corpus LBC Français 
d’environ 20% pour chacune des 4 langues concernées dans le corpus BER, outre 
un grand nombre de textes supplémentaires préparés par d’autres équipes et éga- 
lement en attente d’être intégrés '®. Ce sous-corpus pourra ainsi être intégré pen- 
dant l’année 2023 au corpus Français LBC, qui compte à l'heure actuelle 3 164995 
words et 3 818 747 tokens, dont environ 10% est constitué par des traductions de 
l'italien au français des Vite de Vasari (Farina, Sini 2020: 81). 

La méthode adoptée pour la sélection des données textuelles correspond 
exactement à celle du projet LBC et se fonde sur la délimitation des typologies 
textuelles, des critères chronologiques et d’une zone géographique (cf. Farina, 
Nicolás Martinez 2020: 13). 


3.1.1. Typologies textuelles 


Les textes ont été recueillis en adoptant les catégories établies pour le projet 
LBC, à savoir : textes de vulgarisation (DIV, abréviation du mot italien divulga- 
tivo), comprenant les guides et les blogues touristiques ; textes techniques adres- 
sés à des spécialistes (TEC), entre autres les textes sur les techniques artistiques 


18 Les membres de l’équipe LBC-CeSLiC de l’Université de Bologne se sont donné cette 
limite commune, car pour certaines langues, par ex. le russe, il est moins aisé de repérer 
suffisamment de textes de voyageurs étrangers ayant visité la ville de Bologne et la région 
Émilie-Romagne dans le passé. En effet, comme dans le projet général LBC, la quantité de 
documents recensés dans les différentes langues dépend tant de l'accessibilité aux textes 
que de l’intérét envers le patrimoine artistique italien qui a varié au cours des siècles et selon 
les pays d’origine des différents auteurs. 
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et les textes de critique d’art ; et textes littéraires (LET), catégorie qui englobe 
en premier lieu les récits de voyage mais aussi des correspondances et des textes 
de fiction”. La catégorie « dictionnaires » (DIZ) fait défaut dans le sous-corpus 
BER car, dans les faits, il s’agit d’une catégorie transversale ne se rapportant pas 
à une aire géographique donnée et recouvrant différents domaines reliés aux 
Beaux-Arts (architecture, peinture, sculpture). 

Le sous-corpus DIV-BER comprend des textes tirés surtout de guides tou- 
ristiques en ligne (ex. Orangesmile), de sites web de tourisme, de blogues de 
voyageurs (Yummyplanet), de photographes, mais aussi de sociologues”, de 
sites web de musées et de revues de vulgarisation et culturelles (Télérama). Plu- 
sieurs textes proviennent du blogue français sur le tourisme en Italie, Bellitalie. 
org. Ils décrivent les monuments principaux de la ville de Bologne, ses églises 
(Basilique Saint François, Basilique Saint-Jacques Majeur, Basilique de Saint 
Stéphane ou des « sept églises », etc.), ses musées (ex. Musée archéologique de 
Bologne), les lieux les plus connus de son Université (l’Archiginnasio, palazzo 
Poggi, via Zamboni, les musées universitaires), ainsi que les peintres contem- 
porains nés dans la ville (Giorgio Morandi). Le regard des visiteurs québécois 
sur la ville de Bologne est aussi présent à travers les textes transcrits des chro- 
niques de RadioCanada et des articles de divers titres de la presse québécoise 
(Le Clairon, Le Devoir, Le Soleil, La Presse, etc.) : 21 textes de la catégorie DIV 
ont été en fait puisés dans la Bibliothèque et Archives numériques du Québec 
(BAnQ ), grâce à la collaboration de Myriam Vien et de quelques stagiaires du 
CISQ (Centre InterUniversitaire des Etudes Québécoises), dont le siège central 
est situé à l’Université de Bologne. 

Le sous-corpus LET-BER comprend principalement des journaux et car- 
nets de voyages, des correspondances” et des extraits de romans. Les auteurs 
sont des écrivains et philosophes (à titre d'exemple, René Bazin, Alfred Driou, 
Antoine Claude Pasquin Valéry, Hippolyte Taine), des artistes (Charles-Nico- 
las Cochin, peintre et dessinateur), des intellectuels et personnalités politiques 
(Charles de Rémusat, Honoré Beaugrand), des scientifiques (Charles-Marie 
de La Condamine et Jérôme de La Lande, astronomes), des historiens de l’art 
(Paul Marmottan). Les femmes de lettres sont bien représentées (Noémie Don- 
del du Faouëdic, Anne-Marie du Boccage, Madame de Genlis, Elisabeth De 


Il faut tenir compte du fait que, pour certains textes, l'attribution à l’une des catégories éta- 
blies n’est pas simple ni univoque, car certains textes peuvent faire partie de plusieurs caté- 
gories ou de catégories différentes d’une langue à l’autre. En effet, au fil du temps, le pacte 
de lecture peut changer et les textes rédigés avec une finalité déterminée peuvent rentrer 
aujourd’hui dans une catégorie différente (cf. Farina 2020: 91). 

2 Plusieurs textes sont tirés du blogue très médiatisé Histoires d’Universités créé par le socio- 


logue Pierre Dubois : http://blog.educpros.fr/pierredubois (22/12/2022). 

«Anche la classificazione di testi epistolari nella categoria “Letterario-Biografico” è stata og- 
getto di discussione: le prime corrispondenze introdotte nei corpora sono state quelle di viag- 
giatori del Grand Tour francese in uno stile molto simile a quello dei quaderni di viaggio, si è 
quindi pensato di inserirli nella stessa categoria» (Farina, Nicolás Martinez 2020, 11). 
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Gonzague, Madame de Reck), et, parmi elles, notons la présence remarquable 
de la célèbre écrivaine Madame De Staél (1807) qui a consacré une partie de 
son roman Corinne ou L'Italie au récit de la visite de Bologne des deux protago- 
nistes. Un chapitre de l’ouvrage de Stendhal Écoles italiennes de peinture (1932), 
paru à titre posthume, est consacré à l’« École de Bologne » et a été classé, pour 
l’instant, parmi les textes littéraires pour des raisons purement biographiques. 
Il sera probablement déplacé dans la catégorie des textes techniques à la suite 
d’un travail de révision de la classification des textes qui sera effectué sous peu 
avec la responsable du Corpus LBC Frangais, Annick Farina (cf. Farina, Ni- 
colàs Martinez 2020: 11)”. Les écrits du peintre, illustrateur et critique d’art 
Jean-Joseph Taillasson (1807) surles peintres bolonais Annibal Carrache et Le 
Guerchin seront aussi sans doute placés dans la catégorie TEC, en raison du ca- 
ractère technique du langage employé. 

Outre les descriptions concernant l'architecture de la ville de Bologne, telles 
que les arcades, les portes, les tours, les riches demeures, les jardins intérieurs, les 
théâtres et les palais, on trouve dans cette catégorie, à la différence du sous-cor- 
pus DIV, nombre de fragments textuels consacrés aux lieux de l’Université”, où 
ces voyageurs savants ont parfois assisté à des cours ou enseigné, ainsi que leurs 
réflexions sur la position prééminente de cette Université, sur la qualité et la va- 
riété de l’enseignement, sur l'esprit libéral qui, avec la beauté de la ville, attirent 
un grand nombre d'étudiants de toutes les époques. Des descriptions poétiques 
alternent ainsi avec des comptes rendus pointus et détaillés du patrimoine dela 
ville de Bologne et de ses alentours’* ; on y trouve aussi de véritables critiques 
des œuvres d’art, comme celles de Charles-Nicolas Cochin (1758) concernant 
les peintres de l’école bolonaise. Les artistes les plus évoqués sont les artistes 
du XVI" siècle, comme Nicolò dell’Abate, qui a réalisé les fresques du palais de 
l’Institut des Sciences (aujourd’hui palazzo Poggi), et Pellegrino Tibaldi qui 
a exécuté ses plafonds décorés. Les témoignages récoltés dans ces textes lit- 
téraires dévoilent aussi la stupeur et l'admiration ressenties par les voyageurs 
francophones quant à la position prééminente des femmes enseignant à l’ Uni- 
versité de Bologne dès le XIV siècle (Novella d’Andrea) jusqu’au XVIII° (Ma- 
ria Agnesi, Laura Bassi, Clotilde Tambroni), ce qui fait de ce sous-corpus aussi 


2 «Da queste osservazioni deriva una eterogeneità fra corpora che vorremmo limitare negli 


sviluppi futuri del progetto. Infatti, l’analisi della distribuzione delle tipologie di testi scelti 
in ogni corpus e dei secoli rappresentati alla fine di questa prima fase di costituzione dei 
corpora potrà permettere una più ampia omogeneizzazione in futuro, consentendo lavori di 
comparazione dei testi» (Farina, Nicolás Martinez 2020, 11). 
23 À titre d’exemple : la Bibliothèque, les cliniques médicale et chirurgicale, l'amphithéâtre 
anatomique, les cabinets d'anatomie et d’histoire naturelle, la collection pathologique, les 
musées obstétrique, zoologique, minéralogique, l'observatoire, le jardin botanique, le col- 
lège des Flamands et le collège espagnol. 
24 Nous avons aussi intégré dans cette catégorie un chapitre d’un essai écrit par Bertrand 
Jestaz (1966), qui analyse les voyages en Italie de Robert de Cotte, un architecte du XVII* 
siècle, et présente une description très technique de quelques œuvres architecturales bolo- 


naises, notamment des églises S. Salvatore, S. Paolo et de l’église métropolitaine S. Pietro. 
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un dépôt de connaissances sur l’histoire de la culture et de la société italiennes 
d’un point de vue étranger”. 

Le sous-corpus TEC comprend des textes hétérogènes : catalogues, essais, 
articles de revues spécialisées, principalement dans les domaines de l’archi- 
tecture (L'architecture d'aujourd'hui), de la peinture et de la gravure (Nouvelles 
de l’Estampe)*. Les articles scientifiques, qui couvrent surtout les domaines 
de l'architecture et de l'ingénierie du bâtiment, décrivent minutieusement les 
parties constitutives de certains établissements bolonais, parmi lesquels le Tea- 
tro Comunale de Bologne réalisé par l'architecte Antonio Galli, et fournissent 
des exemples des différents styles architecturaux de la ville (roman, baroque, 
fasciste, etc.). D’autres articles, tirés de revues spécialisées dans les domaines 
touchant aux Musées et aux Beaux-Arts (Bulletin des musées de France, Gazette 
des Beaux-Arts), décrivent quelques œuvres des peintres de l’école bolonaise, 
comme celles de Nicolò dell’Abate, déjà mentionné, et des disciples des Car- 
rache. Dans ce sous-corpus sont aussi présents des textes tirés de revues d’his- 
toire moderne et contemporaine, traitant de différents sujets relatifs aux « arts 
mécaniques » : les corporations des peintres, la censure des images, le marché 
de l’art à Bologne à différentes époques. Des sites web spécialisés, comme celui 
du laboratoire Studio Leonardo, couvrent aussi le domaine de la restauration des 
biens artistiques. Pour finir, quelques articles tirés de L'Encyclopédie Larousse 
ont été intégrés, comme celui sur l’« Académie des Carrache », en vue d’en in- 
corporer d’autres d’ici la fin du projet UniVOCIttà. 


3.1.2. Critères chronologiques 


Afin de pouvoir être intégrés dans les corpus LBC, les textes doivent respec- 
ter des critères chronologiques et donc dater d’une période historique donnée 
qui couvre six siècles : de la Renaissance (XVI siècle) à nos jours (XXI° siècle). 
Comme l’a observé Farina (2020 : 83), à l’heure actuelle, les siècles les plus re- 
présentés dans le corpus LBC Français sont le XIX" et le XXI°. La prédominance 
de ces deux siècles est due à des raisons d'accessibilité des textes : la large pré- 
sence de la littérature de voyage du XIX" siècle et surtout de l’époque roman- 
tique dépend, au-delà de la vaste production de cette époque, d’une plus grande 
disponibilité de textes numérisés qui sont désormais libres de droits. De même, 
pour l’époque contemporaine une grande quantité de textes peut être repérée 
en ligne et téléchargée. 

Dans le sous-corpus BER, la distribution des textes entre les siècles n'est pas ho- 
mogène non plus. Actuellement, les textes recueillis couvrent un cadre temporel qui 
va du XVIII au XXT° siècle, distribués de la sorte pour chaque catégorie (Tab. 2) : 


# Ce potentiel a été justement exploité dans le projet UniCittà déjà illustré. 

26. À titre d'exemple, un texte présente la technique de la gravure, développée à Bologne par les 
Carrache, qui ont été des maîtres aussi bien en peinture qu’en gravure. L'auteur de ce texte 
(Huchet 2011) décrit avec admiration les œuvres des Carrache, citant aussi les palais de 
Bologne où elles se trouvent. 
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Tab. 2. Distribution des textes par siècle et par catégorie dans le sous-corpus BER. 


DIV TEC LET 

- XVII: 1 XVIII: 55 
BER E XIX°:2 XIX°:5 XIX" :29 
Français 

XX°:22 XX° :14 XX°:13 

XXI°:45 XXE: 14 XXI‘:1 
Tot. 69 34 98 


Dans la catégorie DIV-BER, la plupart des documents (45) sont tirés de sites- 
web de voyage, et dans quelques cas, de revues généralistes en ligne, du début 
du XXT" siècle, surtout des années 2019-2021 qui correspondent à la période de 
déroulement du premier projet bolonais. Il est intéressant de remarquer que les 
textes du XX“ siècle (22) viennent en majorité (18) de la presse québécoise de 
l’époque (cf. plus haut) et portent pour la plupart sur l’intérêt de la ville de Bo- 
logne en tant que modèle d'urbanisme et d'exemple de rénovation urbaine. Le 
XIX" siècle n’est représenté pour l'instant que par deuxarticles tirés encore dela 
presse québécoise (La Gazette de Joliette, 1870 ; La Justice, 1890), ce qui permet 
d’inférer que le regard francophone nord-américain sur le patrimoine bolonais 
est bien représenté dans le sous-corpus BER. 

En ce qui concerne la catégorie TEC-BER, alors que les siècles les plus cou- 
verts dans le Corpus LBC Français dans la même catégorie sont le XVII° (80%), 
suivi du XIX" (13.3%) et du XX" (6,7%)”, dans le sous-corpus BER les 34 textes 
présents sont pour l'instant répartis sur deux siècles (14 pour le XX° et 14 pour 
le XXT’). Un seul texte a été rédigé au XVIII siècle, alors que le XVI° n’est pas 
encore représenté, comme pour le Corpus LBC Français (cf. Tab. 2), bien que 
des textes du XVIe siècle soient en cours d'intégration, comme un court texte 
sur Bologne tiré du carnet de voyages de Michel de Montaigne. 

Dansla catégorie LET-BER, la grande majorité des textes (55) date du XVIII° 
siècle. Cela est dû au fait que, comme nous l’avons illustré plus haut, les références 
bibliographiques proviennent d’une anthologie de récits de voyageurs franco- 
phones de ce siècle (Cusatelli 1986). C’est cette caractéristique en particulier 
qui rend ce sous-corpus complémentaire au corpus LBC Français, étant donné 
que ce siècle y est très peu représenté (seulement 3,6%), alors que le XIX" siècle 
y prime avec 61,6% des documents. 

Comme l’a observé Farina (2020: 90), la recherche d’un équilibre formel 
des données du corpus constitue un défi. Nous rappelons à ce propos que, pour 
la représentativité et l’équilibre d’un corpus comparable, il est nécessaire d’in- 
tégrer plusieurs typologies textuelles, genres, registres et auteurs de la langue 
dont le corpus se veut représentatif, et que les échantillons de chaque typologie 
doivent avoir une dimension identique ou le plus comparable possible (McEne- 


7 Données reprises du tableau 4 dans Farina (2020, 85). 
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ry, Hardy 2012). Le corpus comparable LBC frangais est en cours de construc- 
tion et ses premières applications ont mis en lumière quelques limites relatives 
à cet aspect. Son élargissement avec ce sous-corpus vise à combler l’écart exis- 
tant entre les typologies textuelles et la différente représentation des siècles et à 
réduire les sur-représentations dans le corpus, comme celle du Dictionnaire rai- 
sonné de l'architecture française de Viollet Le Duc (1854-1868) mentionnée par 
Farina (2020 : 80). Un plus grand équilibre garantira des résultats plus fiables 
pour mener des études contrastives dans le corpus plurilingue LBC”8. 


3.1.3. Zone géographique 


Alors que la version 1.0 du Corpus LBC Français est caractérisée par la prio- 
rité accordée au lexique de l’art et du patrimoine artistique florentin et toscan 
en français, la portée géographique de ce corpus spécialisé changera à lavenir 
pour couvrirtoute l’Italie et d’autres cultures (cf. Farina 2020: 91, Billero 2020: 
21)”. Le sous-corpus BER se veut représentatif des discours sur le patrimoine 
artistique et culturel de Bologne et de sa région d’appartenance, ce pourquoi le 
critère géographique adopté pour la sélection des textes prévoit la présence du 
nom de la ville de Bologne et des villes de l’Émilie-Romagne, des principaux 
fleuves et rivières qui traversent la région (Savena, Panaro, Reno, Samoggia), 
des chaînes de montagnes (Apennins Tosco-Émiliens), ainsi que des artistes 
nés dans cette région. Nous rapportons ici, par ordre de fréquence, la liste des 
toponymes les plus présents dans le corpus BER dansla langue où elles figurent 
dans les textes (italien ou français) avec, en italique, leurs variantes : 


Tab. 3. Fréquence des toponymes dans les trois catégories du sous-corpus BER. 


Item DIV LET TEC 
Bologne 634 914 118 
Bologna 32 10 2, 
Felsina 4 7 1 
Bononia 2 6 - 
Bononiae 2 - 2 
Parme 11 339 = 
Parma 2 57 - 
Parmes - 1 - 


28 Composé à l’heure actuelle des corpus monolingues allemand, anglais, espagnol, français, 


italien et russe. Cf. http://corpora.lessicobeniculturali.net/ (22/12/2022). 

<Il limite che ci eravamo imposti di prendere in considerazione come prioritarie la città di 
Firenze e la Toscana, si sta spostando per andare a comprendere altre città italiane che han- 
no suscitato l’interesse dei viaggiatori stranieri nel corso dei secoli» (Farina 2020, 91). 
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Item DIV LET TEC 


Plaisance 5 164 - 
Piacenza - 2 - 
Modene 2 156 - 
Modène 13 103 4 
Modena 2 9 - 
Modéne - 3 - 
Ferrare 7 97 2 
Ferrara 1 2 - 
Reggio 5 66 - 
Ravenne 13 53 2 
Ravennes - 4 - 
Ravenna 1 3 - 
Rimini 7 58 - 
Bentivoglio - 43 - 
Bentivogli - 1 - 
Bentiviglio - 1 - 
Imola 1 40 - 
Vignole - 28 - 
Vignola - 6 - 
Vignoles - 1 - 
Faenza 3 21 - 
Forli 6 20 - 
Forlì 3 - - 
Cento 1 16 - 


< Bologne > (en fr.) est évidemment le toponyme le plus fréquent dans les 
trois catégories textuelles, suivi de « Bologna > (enit.) qui est beaucoup moins 
attesté”. La distribution différente des toponymes, en français et en italien, four- 
nit des indices sur les stratégies et sur les approches de traduction en fonction 
des époques et du genre discursif, sujet qui sera repris par la suite (par. 2.2.1). 


3 Nous n'avons pas rapporté dans le tableau 3 les toponymes qui figurent dans le sous-corpus 


BER avec une fréquence inférieure à 15. Les autres toponymes attestés, pour la grande majo- 
rité dans les textes LET, sont: Marzabotto, Corregio / Correges / Corrégio, Cesena / Cesene 
/ Césenne / Césena, Guastalla / Guastella, Loiano, Sassuolo / Sassolo, Villanova, Rubiera, 
Fiorenzuola, Lavino, Galliera / Galiera, Pianoro, Bagnacavallo, Mirandole / Mirandola, 
Saviniano, Castel-franco, Castellana, Castelvetro, Forlimpopoli, Comacchio, Rabierra 
/ Rubiera, Santa-Agata / Santagata, Carpi, Cesenatico, Fontanellato, Fossalta / Fossalte, 
Rangone, Cicognara, Sant’Ilario, Soragna, Verucchio, Pergola, Vetulonia. 
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Le corpus atteste aussi l’ancienne dénomination de Bologne, « Felsina », qui fut 
la principale ville étrusque de l’Étrurie padane, et les appellation latines, « Bo- 
nonia » et « Bononiae ». Après « Bologne », les villes les plus attestées sont les 
chefs-lieux de la région, « Parme », « Plaisance », « Modène », « Ferrare », 
« Ravenne », les localités touristiques les plus connues, comme « Rimini », et 
les villages qui se trouvent le long de l’Apennin tosco-émilien, Pianoro, Marza- 
botto, Loiano, etc., qui étaient des étapes pourles voyageurs du passé traversant 
les Apennins en carrosse ou à cheval pour rejoindre la ville de Florence à partir de 
Bologne et qui sont encore des destinations visées parle tourisme de montagne. 

On remarque que ces toponymes sont attestés pour la plupart dans les textes 
LET, dans une moindre mesure dans les textes DIV et qu’ils sont presque ab- 
sents des textes TEC. On peut en déduire que les textes ont été correctement 
classés, étant donné que les textes techniques se concentrent sur la description 
des œuvres d’art d’un point de vue spécialisé, et non pas sur celle des localités 
touristiques*!. Nous en aurons la confirmation dans le prochain paragraphe 
lorsque nous analyserons les données lexico-terminologiques qui ressortent de 
l'examen du corpus. 


3.2. Données lexico-terminologiques 


Dans cette partie, nous présentons les données lexico-terminologiques qui 
résultent de l’analyse outillée du sous-corpus BER à l’aide du logiciel Sketch 
Engine (SE). Cette analyse, partielle et provisoire, sera approfondie lorsque ce 
sous-corpus sera complété avant d’étre intégré dans le corpus LBC. Sa visée 
est, entre autres, de montrer dans quelle mesure le sous-corpus BER enrichit la 
couverture de la terminologie artistique du corpus LBC Frangais. Nous nous 
appuierons sur les indices donnés par deux fonctions de SE : Keywords, qui per- 
met d’identifier ce qui est spécifique dans un corpus spécialisé, et Wordlist, ou 
liste de mots attestés par ordre de fréquence. 


3.2.1. Keywords / Terms 


La fonction Keywords / Terms permet d’extraire les mots-clés, ou unités lexi- 
cales simples (single-token items), et les termes, ou expressions polylexicales (mul- 
ti-word expressions) qui sont uniques ou typiques du corpus BER (focus corpus). 
Ces mots et termes y apparaissent avec une plus grande fréquence par rapport à 
un corpus de référence (reference corpus), en l’occurrence le corpus français de 
la série TenTen (FrenchTenTen2017), composé de plus de 6 milliards de tokens 
issus de la Toile”. 


Il pourrait y avoir des exceptions à cette règle générale : par exemple, dans les textes TEC du 
corpus LBC on peut trouver plus de références à Carrare lorsqu'on distingue les différents 
types de marbre selon leur origine. 


32 Dernière consultation le 23/07/2022. 
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Le tableau 4 présente la liste des mots typiques du domaine couvert par le 
corpus, à savoir ceux qui apparaissent dans le corpus BER plus fréquemment 
que dans la langue générale et qui, pour cette raison, acquièrent le statut de 
< termes ». On adopte ici la définition de terme telle que l’a établie L'Homme 
(2004, 81), la plus pertinente pour notre approche qui voit le terme inséré dans 
le processus discursif : 


Un terme est une unité lexicale utilisée dans un domaine spécialisé. Le 
lien établi entre l’unité lexicale et le domaine est central dans la démarche 
terminographique. [...] Bien qu’il soit appréhendé en fonction d’un repère 
extérieur à la langue (à savoir le domaine), le terme se matérialise dans les textes. 


En nouslimitant aux 30 premiers résultats, nous rapportons ci-dessous les termes 
qui caractérisent chaque sous-corpus, avec l’indication du score (keyness score), à sa- 
voir le résultat du rapport entre la fréquence relative d’un terme dans le corpus cible 
et la fréquence relative du même terme dans le corpus de référence”. Les termes 
listés sont donc les mots à forte valeur ajoutée (high-scoring words), c’est-à-dire les 
termes qui, comme l'ont expliqué Kilgariff et al. (2014), reflètent très bien le do- 
maine du corpus cible et permettent de définir le thème de chaque sous-corpus. 


Tab. 4. Keywords dans les trois sous-corpus BER. 


keyword fréq. score keyword fréq. score keyword fréq. score 
LET-BER focus DIV-BER focus TEC-BER focus 
Carrache 262 633,1 Maggiore 49 536 Carrache 43 1019 
Guerchin 182 459,7  piazza 78 462 villanovienne 26 667 
lieue 127 87,7 palazzo 64 431 Dominiquin 20 503 
admirable 124 52,5 Morandi 32 405 Certosa 17 430 
marbre 216 50,6 Asinelli 29 404 Guerchin 17 421 
fresque 138 40,5 Garisenda 24 335 Benacci 14 465 
autel 152 36,7 Petronio 24 319 villanoviens 14 364 
tombeau 119 32,2 Archiginnasio 19 265 Etrurie 16 327 
vierge 336 30,2 Poggi 18 228 étrusque 26 280 
palais 456 25,3 Guerchin 16 213 Caravage 17 250 
statue 198 23,05 Bentivoglio 14 185 étrusques 11 198 
orner 145 23,02 Bassi 14 179 villanovien 7 182 
tableau 808 22,75 Accursio 10 140 estudiantin 12 180 
peindre 263 22,74 Nettuno 10 135 pinacothèque 9 177 
mille 358 20,8 cremeria 9 127 Reni J 164 


3 Nous avons éliminé les toponymes, les verbes conjugués (était/ avait, etc.) et les prénoms de 
personnages (Annibal, Augustin), mais nous avons gardé leurs noms de famille. 
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keyword fréq. score keyword fréq. score keyword fréq. score 


LET-BER focus DIV-BER focus TEC-BER focus 

église 199 199 foires 11 125 ossuaire 8 134 
pape 247 18,08 museo 15 124 villanoviennes 5 131 
chapelle 237 17,5 podestà 9 123 terramare 5 129,7 
bronze 122 16,7 erbe 9 120 académisme 7 129,6 
peintre 233 16,3 torri 9 119 Brizio S 129,2 
cardinal 101 14,6 ragù 8 110 Pepoli 5 128 
décorer 127 144 portique 31 107 Gombrich 5 125 
cathédrale 134 14,3 saragozza 7 99 Prosérpine 5 105,4 
ange 113 127 basilique 60 97 Rouchès 4 105 
édifice 117 12,5 cavour 9 96 Pigorini 4 103 
gloire 102 11,5 tortellini 7 95 biconique 4 102,8 
galerie 144 11,1 podestat 8 94 professore 4 102 
bâtir 113 10,89 Caravage 11 87 Lavergnée 4 101 
beauté 211 10,81 tagliatelle 9 85 Brejon 4 100 
considérable 101 10,81 Farini 6 83 esthète 6 99 


Le premier terme listé dans les sous-corpus LET et TEC, avec un score très 
élevé, est « Carrache » (Carracci), le nom de famille des deux frères Annibal et 
Augustin et de leur cousin Ludovic, les principaux représentants de l’école bo- 
lonaise de peinture. On en déduit que leurs œuvres, ainsi que celle de Guerchin, 
nom qui est aussi très attesté, font l’objet de commentaires et de descriptions 
dans les textes de ces deux sous-corpus en particulier. 

Le sous-corpus LET présente, comme mots-clés, des noms propres d'artiste 
(Carrache, Guerchin) et un grand nombre de termes des trois domaines pris en 
compte (en gras dans la première colonne du tableau 4). Le thème dominant de ce 
sous-corpus DIV est donc le patrimoine artistique tout court. On remarque aussi 
la présence des adjectifs évaluatifs, « admirable >, « considérable > (soulignés), 
qui confirment que les textes témoignent du regard subjectif des visiteurs étrangers 
face au patrimoine artistique bolonais. Ces données montrent la pertinence des 
choix méthodologiques effectués par les concepteurs du projet LBC d'intégrer un 
grand nombre de textes littéraires pour attester le lexique employé pour le décrire. 

Les textes DIV présentent des caractéristiques bien différentes. Ici très peu de 
termes du domaine de l’art (en gras), alors que les mots-clés avec le score le plus 
élevé sont les noms propres des monuments et des lieux symboles de la ville de 
Bologne : Maggiore, le nom de la place principale, Garisenda et Asinelli, les deux 
tours les plus connues, les noms des palais (Poggi, d’Accursio), des musées (Archi- 
ginnasio), des églises (San Petronio) et des piazze (Nettuno). Ce qui ressort ici, 
c’est la présence de noms appartenant au champ lexical de la gastronomie (souli- 
gnés) qui désignent les produits typiques de cette région (ragù, tortellini, tagliatelle), 
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ce qui confirme que, la nourriture faisant partie du patrimoine culturel partagé, 

ce corpus a été construit en tenant compte d’une définition large de patrimoine. 

Les mots-clés indiquent ainsi que ces textes déploient des informations sur les cu- 

riosités touristiques et gastronomiques de la ville de Bologne. La présence abon- 

dante de termes en italien pour désigner les places, les palais, les musées et méme 
les tours confirme ce que nous avons observé concernant les toponymes : dans 
les textes de vulgarisation on a plus recours à l’italien que dans d’autres typolo- 
gies textuelles, ce qui rejoint l'observation de Farina et Billero (2020, 172) : « The 
abundant use of Italianisms is a dominant feature ofthe tourist guides analyzed ».. 

Les textes TEC présentent des mots-clés qui se distinguent nettement des 
deux autres sous-corpus. Le score le plus élevé est celui qui résulte de la somme 
des différentes formes fléchies de l’adjectif « villanovien ». Le thème dominant 
est ici la protohistoire bolonaise, ce qui est corroboré par la présence des mots- 
clés « Benacci »%, « Étrurie », « étrusque », « ossuaire », « terramare »%. 

On remarque aussi la présence d’un terme du domaine de l'archéologie (« bico- 

nique ») et de quelques termes qui relèvent de la critique d’art (« académisme », 

< esthète »). Parmi les noms propres, outre les noms d'artistes de l’école bolo- 

naise du XVI° siècle (Carrache, Dominiquin, Guerchin, Reni, Brizio) et du mi- 

lanais Caravage, on relève la présence de noms d’historiens de l’art du XX siècle 

(Gombrich, Rouchès, Brejon de Lavergnée) et d’un archéologue (Pigorini). En 

raison de sa très petite taille, le sous-corpus TEC permet ainsi de recueillir, par 

bribes, des attestations à la fois de la terminologie scientifique et technique des 
domaines concernés, mais aussi de la terminologie de la critique d’art qui se ca- 
ractérise par un plus grand degré de liberté dans l'expression dans le but de sur- 
prendre le lecteur. C'est principalement sur l’ajout de textes techniques d’abord, 
et de textes de vulgarisation, que portera le travail d’équilibrage du corpus. 

L'extraction des expressions polylexicales (terms ou multi-word expressions), 
qui sont uniques ou typiques du corpus BER (focus corpus), confirme les obser- 
vations que nous venons de formuler. Nous les énumérons ci-après, sans en pré- 
ciser la fréquence et les scores par souci de brièveté : 

e _ Terms LET : Louis Carrache; 

e Terms DIV : Piazza Maggiore, San Luca, San Petronio, Tour Asinelli, Santo 
Stefano, Giorgio Morandi, Tour Garisenda, Basilique San Petronio, Merca- 
to delle Erbe, Laura Bassi, Palazzo Poggi; 

e Terms TEC: école bolonaise, archive historique, Annibal Carrache, Première 
tombe, Tombe Benacci, Guido Reni, Palais Pepoli, Sainte Cécile, Art photo- 
graphique, Tableau bolonais, Tombes villanoviennes. 


Nous concluons que la méthodologie offerte par l’analyse statistique des cor- 
pus, notamment par la fonction Keywords/Terms de SE, s'avère très performante 


34 Nom d’un tombeau de la Bologne étrusque. 


3% Nom d’un peuple qui habitait, avec les Villanoviens, la région de Bologne durant la préhis- 
toire (cf. Cotteau 1889). 
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pour la compréhension du contenu et pour l’analyse préliminaire des termes les 
plus significatifs du sous-corpus. La Wordlist, qui fera l'objet du paragraphe sui- 
vant, permet de compléter cet apercu avec l’analyse des fréquences de tous les 
mots attestés dans le corpus. 


3.2.2. Wordlist 


Nous nous sommes concentrée sur deux catégories grammaticales, les verbes 
et les noms. Les tableaux S et 6 rapportent la liste, respectivement, des formes 
lemmatisées des verbes et des noms dont la fréquence est égale ou supérieure à 
20 dans un des trois sous-corpus BER. Nous avons trié manuellement les résultats 
de l’extraction automatique faite par SE, en supprimant de la liste des noms les to- 
ponymes, déjà vus plus haut, les noms propres des artistes (Carrache, Guerchin, 
etc.), les noms qui relèvent des professions (maître, peintre, artiste, etc.), des 
matériaux (marbre, pierre), des parties du corps (main, tête, pied), et les termes 
abstraits (beauté, goût, etc.). Nous avons également éliminé tous les noms et les 
verbes qui ne relèvent pas strictement du discours sur l’art (« école », « univer- 
sité », « étudiant », « visite », « visiter », « marcher », etc.). 


Tab. 5. Wordlist des verbes dans le sous-corpus BER. 


Item fréq. LET fréq. DIV fréq. TEC 
représenter 404 32 58 
peindre 323 14 21 
élever 249 16 10 
conserver 196 30 30 
composer 191 11 7 
orner 176 7 2 
bâtir 163 10 2 
décorer 151 4 4 
construire 116 34 4 
dessiner 95 1 2 
exécuter 91 1 5 
étayer 73 17 20 
graver 48 2 2 
dorer 42 1 3 
garnir 39 3 2 
ériger 29 8 1 
sculpter 28 6 1 
paver 26 2 1 
restaurer 24 14 5 
fortifier 23 - - 
embellir 21 - 2 
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Tab. 6. Wordlist des noms dans le sous-corpus BER. 


item fréq. LET fréq. DIV fréq. TEC 
tableau 808 6 78 
piazza 13 78 i 
palais 456 77 15 
église 610 100 15 
ouvrage 334 6 3 
vierge 330 11 - 
maison 317 44 17 
figure 292 6 20 
peinture 259 31 74 
place 238 69 12 
chapelle 237 18 2 
statue 198 20 1 
couleur 183 17 14 
tour 174 122 12 
porte 170 31 3 
cour 169 43 26 
autel 152 5 - 
galerie 144 14 14 
fresque 138 21 4 
cathédrale 134 11 1 
portique 112 31 1 
composition 119 4 14 
tombeau 119 15 - 
édifice 117 31 14 
colonne 94 11 2 
fontaine 84 20 2 
musée S1 76 45 
loge 47 - 13 
coupole 72 3 - 
pont 73: 2 3 
dessin 72 15 27 
arcade 84 45 5 
coloris 71 1 - 
palazzo 24 64 3 
rue 159 60 4 
quartier 15 Sl - 
paysage 39 8 56 
tombe 7 9 39 
restauration 4 17 27 
technique 1 2 22 
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Dansle tableau 6, on observe que certains concepts sont désignés en langue 
italienne surtout dans les textes du vulgarisation (piazza : 78 occurrences dans 
DIV vs 13 occurrences dans LET ; palazzo : 64 occ. dans DIV vs 24 dans LET 
et 3 dans TEC), alors que leur équivalent en français figure plus fréquemment 
dans les textes littéraires (« place » : 238 occurrences dans LET vs 69 dans 
DIV et 12 dans TEC; « palais » : 456 occ. dans LET vs 77 occ. dans DIV et 15 
dans TEC). Cette donnée, qui est observable aussi dans la liste des toponymes 
(cf. Tab. 3 dans paragraphe 2.1.3), signale que la dénomination d’un concept 
peut varier (dans ce cas en frangais ou en italien) selon la typologie textuelle et 
selon le pacte de lecture avec le destinataire. Un corpus comparable spécialisé, 
qui rend possible la recherche par métadonnées des catégories et sous-catégo- 
ries textuelles (Billero 2020, 30), donne ainsi des indices sur les stratégies de 
traduction du lexique qu'il faudra déployer en tenant compte de ces variables. 

Pour ce qui concerne la couverture de la terminologie artistique, mise à part 
la présence de certains hyperonymes pouvant se rapporter aux trois domaines 
confondus (« représenter », « composer », « orner », « embellir > parmi les 
verbes et « ouvrage », « figure », « composition », « restauration », « tech- 
nique » parmi les noms) ou à des sujets représentés dans tous les arts (« vierge >), 
ainsi que du phénomène de la polysémie (« composer >»), on remarque que cha- 
cun des domaines pris en considération (architecture, peinture, sculpture) est bien 
représenté par du « lexique charnière » (Cabré 1991), à savoir un lexique puisé 
dans la langue commune et employé aussi dans un domaine spécialisé, et rarement 
par des termes hautement spécialisés, cela principalement à cause du fait que, 
comme on l’a vu, les textes techniques sont à l'état actuel très peu représentés : 

e Pourlapeinture : « peindre », « dessiner » ; « tableau », « couleur », « fre- 
sque », « composition », « dessin », « paysage », « coloris » ; 

e _ Pourl'architecture : « élever », « bâtir », construire », « étayer », « ériger >», 
« fortifier » ; « piazza », « palais », « église », « maison », « place », « cha- 
pelle », x tour », « porte », « COUr », « autel >», « galerie », « cathédrale », 
« édifice », « portique », « musée », « coupole », « pont », « arcade », 
< palazzo », « rue > ; 

e Pour la sculpture : « orner », « graver », « sculpter » ; « statue », « tom- 
beau », « colonne », « fontaine », « tombe ». 


On relève dans le tableau 5 la présence d’un terme technique du domaine de 
l'architecture, le verbe « étayer », qui est en fait attesté dans le Grand Dictionnaire 
Terminologique (GDT) comme relevant de l’industrie de la construction“. Il est 
intéressant de comparer les données relatives à sa fréquence : malgré le fait que 
le sous-corpus TEC a une taille plus petite que le sous-corpus DIV, ce verbe yest 
plus fréquent (20 occurrences dans TEC vs 17 dans DIV). La même remarque 
peut se rapporter à d’autres verbes comme « peindre », « exécuter » », « repré- 


3% Cette donnée ouvre des questionnements sur la représentation actuelle du domaine des 


beaux-arts dans les banques de terminologie. 
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senter » qui sont aussi plus fréquents dans les quelques textes TEC que dans les 
textes DIV (cf. Tab. 5). Cela suggère que dans DIV le patrimoine artistique est 
simplement mentionné et non pas décrit de manière pointue. 

On en déduit que la quantité de lexique charnière relatif au domaine des 
arts est plus importante dans les textes LET et TEC, alors que dans les textes 
DIV, c’est plutôt le lexique de la langue générale qui est le plus représenté. Cet 
acquis, bien qu’il repose sur une quantité de données qui n'est pas suffisante ici, 
témoigne de la relation étroite entre le contenu des trois sous-corpus pris singu- 
lièrement etle degré de spécialisation de la langue attestée, qui corrobore encore 
une fois la pertinence des choix méthodologiques adoptés par les concepteurs du 
projet LBC : les textes DIV représentent la langue générale ou non spécialisée, 
le lexique charnière ou sub-technique est incarné par le sous-corpus LET et le 
lexique spécialisé sera attesté par l'élargissement du corpus TEC. 

Les tableaux 5 et 6 affichent une autre donnée qui montre distinctement la 
spécificité du corpus BER et sa complémentarité avec le corpus LBC Français : 
l'échantillon de noms et verbes relatifs au domaine de l’architecture est le plus 
riche. Cela dépend sans doute du fait que, d’une part, le patrimoine artistique 
de la ville de Bologne compte une grande partie de biens immobiliers (palais, 
musées, édifices historiques) appartenant à l’Université, et que, d’autre part, 
un patrimoine architectural très important pour cette ville est représenté par 
les « arcades » (ou « portiques >), nommés par l'UNESCO en 2021, qui sont, 
avec les nombreuses anciennes « tours », un symbole de la ville et de la région. 
Elles font en effet l’objet d’un très grand nombre d’attestations dans toutes les 
catégories textuelles (Tab. 5). On approfondira la portée de ces éléments dans 
la prochaine section, consacrée à l’application de la méthode d’analyse choisie. 


4. Stratégies de traduction basée sur corpus (CTS) : résultats significatifs du 
corpus BER 


Dans cette dernière section, nous essayerons d'illustrer dans quelle mesure 
l'approche adoptée dans le cadre du projet LBC (corpus-driven) permet de « faire 
émerger de manière inductive des savoirs linguistiques » (Williams 2005, 13), 
concernant notamment le phénomène de la synonymie (diastratique et diato- 
pique) en terminologie. On montrera que ces savoirs, induits à partir d’un cor- 
pus comparable, fournissent des pistes pour déployer de nouvelles stratégies 
pour la traduction du lexique artistique qui ne sont pas prises en compte par les 
ressources plurilingues disponibles à l’heure actuelle. On se concentrera sur un 
cas d’étude : la traduction française des portici bolonais. 


4.1. Cas d'étude : la traduction française des portici bolonais 


L'analyse rapprochée des données lexico-terminologiques du sous-corpus 
BER révèle une distribution différente, dans les trois typologies textuelles, d’une 
série de synonymes terminologiques employés en langue française pour désigner 
les célèbres portici (en italien) de la ville de Bologne. Ce sont : « portiques », 
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« arcades » et « galerie »*. Nous avons établi cette série synonymique en nous 
fondant, dans un premier temps, sur la wordlist et surl’analyse des concordances 
et, dans un second temps, surla lecture attentive des extraits textuels. Ces deux 
passages ont confirmé que ces mots sont bien employés dans les textes français 
comme synonymes intralinguistiques du mot italien portici. Nous en rappor- 
tons ci-dessous un échantillon représentatif : 


Ce que Bologne offre de vraiment singulier en édifices, c’est cette galerie?’ 
composée de sept cents arcades, fermée au nord, ouverte au midi et qui, dans 
la longueur d’une lieue, conduit de la porte de la ville à celle d’une église [...] 
L'église à laquelle aboutit ce portique, est tellement couverte d’ex voto, qu'on 
en remarque à peine toutes les proportions. (LET, La Porte 1779) 


Pour rendre ce pèlerinage facile & commode, même agréable en tout temps, 
il a été construit une Galerie, ou Portiques ouverts, qui partent des murs 
de la ville, & conduisent sans interruption jusqu’au sol & près du portail de la 
Madonna: cette distance distribue au delà de sept cents cinquante arcades d’une 
construction uniforme, agréable & solide. (LET, La Roche 1783) 


Près de la chartreuse s'ouvre l'entrée de cet immense et singulier portique qui 
fut commencé en 1674, fini en 1739, au moyen d'une contribution volontaire 
des habitans de Bologne, et dont les six cent trente-cinq arches courent sur une 
ligne de près de S kilomètres, d’abord en plaine, puis sur la pente du Monte della 
Guardia. (LET, Rémusat 1861) 


Comme il y a dans cette chartreuse un grand nombre de cloîtres au rez-de- 
chaussée, dont chacun présente un parterre et quatre faces de galerie, le cimetière 
pourra suffire très longtemps aux besoins de la ville, à laquelle on se propose de 
le joindre prochainement, par une suite d’arcades de même espèce que celles 
qui bordent, de chaque côté, les plus belles rues de Bologne, et qui y sont d’une 
grande ressource pour les gens de pied contre le soleil et contre la pluie. (LET, 
Plessis 1903) 


L'église Madonna San Luca, sise au pied des monts, tout près de Bologne, est un 
lieu de pèlerinage pour tous les fidèles de l’Italie. On s’y rend en passant sous 
une arcade de 640 arches magnifiques. (LET, Couture 1926) 


La Madonna di S. Luca, église située à une lieue de Bologne sur une montagne 
; on y va par une belle galerie en portiques, formée de 700 arcades, et qu'on 
appelle il Porticato di S. Luca, qui rend le pélerinage très-commode : c’est un 
des plus grands monumens de la dévotion des Italiens à la Sainte Vierge : mais 
il ne doit son existence qu’à la générosité des habitans de Bologne. (La Lande 
1769 chap. VI) 


Ilya aussi une occurrence de « arches » pour désigner les « arcades » dans Rébéna (2017). 


% Le gras est le nôtre. 
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À une lieue de Bologne, et sur la montagne de Guardia, est une église dédiée à la 
Sainte-Vierge, et où l'on arrive par un portique de 690 arceaux qui commence à la 
porte de la ville et va jusqu’au sommet de la montagne. (LET, Starke 1833-1834) 


À l’ouest est le monte della Guardia précédé d’un long portique de 650 arcades. 
Au centre deux hautes et antiques tours, penchées d’une manière effrayante. 
(LET, Marmottan 1918) 


Parmi les coupoles et les places, l’arc de Meloncello mène à un sanctuaire par 
le passage sous un grand portique. Une trentaine d’arcades sur cent quarante 
mètres de façade se succèdent, soutenues par des colonnes doriques. (DIV, La 
Presse 1968) 


Tout en cheminant lentement et en m’arrétant devant les curiosités de la ville, 
me voici bientôt en face d’un immense portique en maçonnerie composé 
de centaines d’arcades (630), la plupart ornées de peintures et de pieuses 
inscriptions. Cette galerie qui s’étend sur une ligne de près de quatre mille, 
monte sur la colline jusqu’à l’église Saint-Luc. (LET, QB, Rocheleau 1922) 


Les 666 arcades de voûte, d’une longueur de près de quatre kilomètres (3796 
m), relient efficacement San Luca, comme on l'appelle communément, au centre- 
ville. Ces portiques abritent la procession traditionnelle qui porte chaque 
année depuis 1433 une icône byzantine de la Vierge à l'Enfant attribuée à Luc 
l’évangéliste jusqu’à la cathédrale de Bologne pendant la fête de l’Ascension. 
(DIV, Buchot 2020) 


L'observation de l'emploi en discours de données langagières authentiques 
à l’intérieur du corpus prouve qu'il est donc possible de désigner en français les 
< portici > bolonais en faisant appel à différents moyens lexicaux et discursifs (si- 
gnalés en gras). Si on transpose ces savoirs à la sphère de la traduction, on retien- 
dra que plusieurs équivalents traductionnels de « portici > sont envisageables : 
« galerie >, « portique », « arcade », au singulier ou au pluriel”, ainsi que « por- 
tique ouvert », « galerie ouverte », « galerie en portiques », « arcades de voûte ».. 

En contexte multilingue, l'objectif de cette méthode d'analyse serait idéale- 
ment de repérer des équivalents traductionnels de mots dans des corpus com- 
parables, permettant de pallier le manque de corpus parallèles (Zweigenbaum, 
Habert 2006). L'absence à l’état actuel d’un corpus monolingue BER italien ne 
nous permet pas de comparer ces données avec un ensemble de textes qui, dans 
la langue italienne, sans être en rapport de traduction mutuelle, traitent des 
mêmes sujets et domaines couverts par le corpus BER. Cependant, nous pou- 
vons accéder à des textes originaux produits en français qui suggèrent des équi- 
valents traductionnels potentiels dont les ressources lexicographiques d'aide à la 
rédaction plurilingue et à la traduction ne font pas état. Nous montrons, à titre 
d'exemple, l'entrée portico du dictionnaire bilingue de référence français-italien 


# Le mot « arcades » au pluriel se réfère dans plusieurs cas aux arches dont les portiques sont 
composés. Dans ces cas, nous ne l’avons pas signalé en gras. 
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Boch (2020) de la maison Zanichelli, où trois équivalents traductionnels de ce 
mot sont proposés : 1. « portique », 2. « arcades » et 3. « porche » (Fig. 2). 


arcades 
3 (di chiese, edifici e sim.) porche 


4 porche: il POMES di una fattoria, le porche d'une ferme. 


Fig. 2 Entrée « portico » dans le dictionnaire Boch (2020). 


Les informations métalinguistiques présentées entre parenthèses avant les 
équivalents 2 et 3 signalent, respectivement, que « arcades » au pluriel ne serait 
utilisé qu’en référence, ou en collocation, avec des rues, places et entités simi- 
laires (di strade, piazze e sim.) et que « porche » serait employé pour les portici 
des églises et édifices de toutes sortes. Aucune information n’est donnée par ail- 
leurs pour guider l'utilisateur dans la compréhension de l'emploi de l’équivalent 
< portique ». Au contraire, la présence d’un seul exemple relatif aux portiques 
d'Athènes pourrait le dérouter, le conduisant à considérer que ce mot ne peut 
se rapporter qu’à l'architecture grecque. 

Or, ces informations ne coïncident pas, voire sont en contradiction avec les 
données relevées dans le sous-corpus BER, étant donné que « arcades » est bien 
attesté pour désigner les portici longeant les rues de Bologne (Plessis 1903), et 
que c’est « portique », et non pas « porche » (très peu attesté dans le sous-cor- 
pus BER)“, qui est principalement employé en collocation avec des églises, no- 
tamment l’église de la Madonna di San Luca (La Porte 1779, Starke 1883, etc.). 
En outre, « galerie », un autre synonyme largement attesté dans le corpus BER, 
n’est pas du tout pris en compte par ce dictionnaire. 

Une analyse plus approfondie des données relatives à la fréquence statistique 
de ces synonymes intralinguistiques nous permet d’estimer que les lacunes des 
ressources existantes portent non seulement sur la couverture des équivalents 
traductionnels possibles, comme on vient de le voir, mais aussi sur la prise en 
compte de leur emploi en discours. En fait, l'examen des données statistiques 
relatives à la fréquence et à la distribution de ces synonymes dans les trois caté- 


#3 occurrences de « porche » et dans BER-DIV et dans BER-LET. 
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gories textuelles du corpus BER nous amène à formuler un certain nombre de 
remarques sur la variabilité de l’emploi de ces mots / termes en discours. 


galerie 


arcade 


portique 


i 


0 20 40 60 80 100 120 140 160 
TEC mDIV mLET 


Fig. 3 Occurrences de « portique », « arcade » et « galerie > dans les sous-corpus BER. 


Compte tenu du fait queles textes DIV ne représentent que 12% du sous-cor- 
pus contre 80% des textes LET (Fig. 3) : 

e la fréquence de « arcade » (45) y est proportionnellement beaucoup plus 
élevée par rapport au texte LET (71), à savoir ce terme est beaucoup plus 
employé dans les textes DIV que dans les textes LET ; 

e < portique » (94) est plus fréquent que « arcade » (71) dans les seuls textes 
LET ; 

e «arcade » (45), au singulier et au pluriel, est plus fréquent que « portique > 
(31) dans les textes DIV; 

e «galerie », souvent employé comme synonyme hyperonymique de ces deux 
termes, est bien plus fréquent dans les textes littéraires (144) que dans les 
textes DIV (14) et TEC (14). 


Ces données semblent confirmer « l'existence de nombreux synonymes 
dans la terminologie artistique, qui ne témoignent pas de différences de nature 
conceptuelle mais diastratique » (Cetro 2022, 140). On suppose donc que dans 
la langue générale, représentée parle sous-corpus DIV, c'est le mot « arcades » 
qui traduit le mot italien portici, bien que la traduction « portique » soit éga- 
lement possible mais avec une fréquence inférieure. Dans la langue sub-tech- 
nique, représentée par le sous-corpus LET parla voix d’un public cultivé mais 
non spécialiste, c’est en revanche le mot « portique > qui traduirait plus fré- 
quemment le mot italien portici. Quant au discours spécialisé de l'architecture, 
nous n'avons pas suffisamment d’attestations de ces termes dans le sous-corpus 
TEC pour pouvoir avancer des hypothèses sur l'emploi de ce terme. On relève 
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toutefois que la comparaison de la fréquence de cette série synonymique dans 
le sous-corpus BER avec le corpus LBC Frangais fournit d’autres indices inté- 
ressants qui jettent une lumière sur son emploi dansle discours spécialisé, voire 
dans la lexicographie de spécialité“. 

En tenant dùment compte des différentes proportions du corpus LBC Fran- 
gais et du sous-corpus BER, étant donné que la taille de ce dernier correspond à 
1/6° de la taille totale du corpus LBC Français, le premier indice intéressant est 
le constat qu’il n’y a pas d’écart considérable entre le nombre d’occurrences de 
< arcade » (151) et de « portique » (123) dans le sous-corpus LET LBC Fran- 
çais, alors que cet écart est bien plus évident dans le sous-corpus LET BER Fran- 
çais, où la fréquence de « portique » (112) est plus élevée que celle de « arcade » 
(71) et proportionnellement beaucoup plus importante que dans le corpus LBC 
(cf. Figg. 4 et 5). 


Sous-corpus BER Français 


mul 
wc [BI 
[21 
Me 3 
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mloge marcade mportique 


Fig. 4 Nombre d’occurrences de « arcade », « portique » et « loge > dans le corpus BER. 


On remarque aussi que dans les textes techniques du corpus LBC, « por- 
tique » est beaucoup plus fréquent (257) que dans les textes LET (123), ce qui 
suggère que l’utilisation de « portiques » pourrait avoir droit de cité dans des 
textes écrits par des professionnels du domaine. Tout cela nous amène à conclure 
que l'hypothèse avancée à partir de la seule consultation du corpus BER est va- 
lidée par la consultation du corpus LBC Français, qui porte principalement sur 
la Toscane, à savoir que « portique » est bien un terme du domaine de l’archi- 
tecture. Le fait qu'il figure, à l’intérieur du corpus LBC, aussi bien dans un dic- 
tionnaire spécialisé, le Dictionnaire raisonné de l'architecture française d’ Eugène 
Viollet-le-Duc (1854-1868), que dans un ouvrage de l’historien de l’art Léon 


# Nous avons exclu de cette comparaison le terme « galerie », bien que fréquent dans le 
sous-corpus, à cause de sa polysémie qui infirme certaines considérations fondées ici sur 
des critères purement statistiques. 
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Palustre (1892), confirme qu’on se trouve bien face au phénomène de la syno- 
nymie diastratique en terminologie. 


Corpus LBC Frangais 


E 


ps 
DIV f3 
33 
0 50 100 150 200 250 300 


mloge marcade w portique 


Fig. S Nombre d’occurrences de « arcade », « portique » et « loge > dans le corpus 
LBC Frangais. 


« Portique » est un terme, très employé pour désigner les « portici > bo- 
lonais, comme on l’a déduit de sa fréquence proportionnellement très élevée 
dans les textes littéraires et de vulgarisation du corpus BER. Ces données nous 
amènent à émettre une autre hypothèse : « portique », un calque de la langue 
italienne, peut être aussi considéré comme un mot désignant une realia, une réa- 
lité typique de l'architecture bolonaise. Autrement dit, un locuteur français non 
spécialiste emploierait « arcades » pour désigner toute « construction formée 
d’un arc de voûte soutenu par des piliers ou des colonnes » (TLFi), y compris 
les « arcades » de la rue de Rivoli ou de la Place des Vosges à Paris. En revanche, 
un autre type de locuteur, à qui l'architecture bolonaise serait familière sans être 
un spécialiste, comme nos voyageurs francophones représentés par le sous-cor- 
pus BER-LET, emploierait par osmose le calque « portique » qui désigne pré- 
cisément l'architecture culturo-spécifique bolonaise et non pas ‘tout type’ d’« 
arcades » (cf. Zotti 2003). La myriade d'articles disponibles sur la Toile qui an- 
noncent la nomination des « portiques » de Bologne au patrimoine culturel de 
l'UNESCO semblent confirmer le constat qui émerge de l’analyse du corpus. 

Pour finir, la comparaison des données de BER avec le corpus LBC Français 
a fait apparaître une autre donnée significative : « loge » et l’italianisme « log- 
gia», tous les deux assez fréquents dans le Corpus LBC Français (« loge » : 162 
dans LET ; loggia : 110 au total), sont en revanche presque absents du sous-cor- 
pus BER (« loge » : 47 dans LET et 13 dans TEC et DIV ; loggia : 3 au total)*. 


4. Dansl’édition italienne de 1568 des Vite de Vasari, il y a de nombreuses occurrences du mot 
loggia en italien. Les traductions françaises que nous avons analysées en vue de la consti- 
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La fréquence et la distribution différentes de ces synonymes partiels reflèteraient 
aussi à notre avis l’influence des facteurs géographiques et historiques sur la dé- 
nomination des concepts, étant donné que diverses traditions architecturales 
dans les régions d'Italie correspondent à une diffusion variée des termes les 
dénommant. On voit donc clairement que les corpus sont affectés par les diffé- 
rences linguistiques entre les cultures (cf. Laviosa 2002), et que l’histoire de la 
terminologie des arts et métiers permet de pénétrer dans l’histoire des sociétés, 
en particulier européennes (cf. Zanola 2018). Cette affirmation est tout à fait 
pertinente même lorsqu'on se réfère à un pays comme l'Italie, longtemps frag- 
menté politiquement et culturellement. 

La consultation d’une ressource de dernière génération, BabelNet*, présentée 
comme « le plus grand dictionnaire encyclopédique multilingue continuelle- 
ment mis à jour » (Navigli 2018) et qui est, de fait, un réseau sémantique multi- 
lingue etune ontologie lexicalisée, ne donne pas de résultats plus exhaustifs que 
le dictionnaire bilingue Boch-Zanichelli, tout au moins pour ce qui concerne la 
traduction du lexique artistique (Fig. 6). 


= $ Babelet Et Login | Preferenze 


i a 
E portico dè - porticato «ld + pronao 4) + stoà I 


Il portico è una galleria aperta, collocata per lo più all'esterno e al piano 
terreno di un edificio; può avere funzione di riparo o anche solo 
decorativa, 44 


TRADUZIONI DEFINIZIONI 


talian French x - 


portique 


Un portique est une pièce, un passage ou une galerie ouverte en rez-de-chaussée et couverte entre deux colonnades ou rangs d'arcades. 


$% SAPIENZA NLP | Babelscape 


Fig. 6 L'entrée italien francais « portico > dans BabelNet. 


On considère de la sorte que l’intégration d’un sous-corpus surle patrimoine 
de l’Emilie-Romagne à l’intérieur du corpus LBC, qui se focalise principalement 
sur la Toscane, pourrait révéler aussi des informations inédites surles synonymes 


tution d’un corpus parallèle des traductions de cet ouvrage attestent ces trois équivalents 
traductionnels : portiques, galerie et loggia. 

# Cette ressource, disponible sur https://babelnet.org/ (22/12/2022), a été développée parle 
groupe Natural Language Processing de l’Université Sapienza de Rome. 
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terminologiques de nature diatopique qui auront également des retombées sur 
l'attribution de l’équivalent le plus pertinent dans la pratique traductive. L'ap- 
proche proposée par la traduction basée sur les corpus (Applied Corpus Transla- 
tion Studies) s'avérera donc précieuse pour traduire plus précisément des termes 
du patrimoine de la ville de Bologne à l’intérieur des fiches du futur dictionnaire 
plurilingue du patrimoine culturel LBC (cf. Farina, Billero 2020). 


5. Conclusions 


La ville de Florence a été la destination privilégiée de nombreux voyageurs 
aristocrates européens du Grand Tour, elle a continué de l’être au courant des 
XIX" et XX" siècles et l’est encore aujourd’hui. En revanche, la ville de Bologne 
n'a généralement été qu’une étape de passage pour les voyageurs qui se diri- 
geaient vers Florence et Rome, après avoir traversé les Apennins Tosco-Émi- 
liens. En conséquence, Bologne a toujours bénéficié d’un type de tourisme de 
nature différente, davantage « culturel > qu’artistique, à cause de la présence 
de son ancienne Université, et, plus récemment, grâce à sa nomination comme 
ville créative UNESCO en 2006 et à l'insertion de ses portici dans la liste du 
Patrimoine Mondial UNESCO en 2021. Il va de soi que les récits de voyage, 
les guides touristiques et les œuvres critiques du passé et du présent n’ont pas 
été publiés dans la même proportion que pour la ville berceau de l’art italien et 
que les auteurs ne se sont pas arrêtés sur les mêmes thématiques. Cette diversité 
constitue pourtant un atout pour le futur élargissement du corpus LBC. 

La constitution du sous-corpus Bologne et Émilie-Romagne va, de fait, dans 
la direction du premier objectif visé par l’équipe de recherche LBC, à savoir la 
constitution d'un corpus comparable multilingue centré sur la description du 
patrimoine artistique italien, étape nécessaire et préalable à la création d'un dic- 
tionnaire plurilingue du patrimoine culturel. L'exploitation d’un corpus com- 
parable de ce type, qui prend en compte un large éventail d’énonciateurs et de 
situations dans lesquelles le discours plus ou moins spécialisé sur l’art italien 
est produit, présente un grand intérêt aussi bien dans des travaux de traduction 
que dans des recherches en terminologie et en sociolinguistique, comme nous 
Pavons vu en nous arrêtant, avec notre cas d’étude, sur le phénomène de la va- 
riation diastratique et diatopique en terminologie. Ce simple cas d’étude, qui 
sera approfondi par la suite, a dévoilé les deux « âmes » de la terminologie artis- 
tique, l’âme humaniste et l’âme technique, tout en jetant une lumière aussi bien 
sur l’histoire des langues et des cultures que sur les dynamiques de la commu- 
nication spécialisée selon une perspective à la fois nationale et internationale. 

Le corpus comparable multilingue LBC a la vocation d’être une ressource 
flexible, créée ad hoc pour une étude ciblée du lexique artistique. Sa taille, dé- 
terminée par la finalité du corpus, est modulable et en continuelle expansion. 
Le logiciel d'exploration adopté par le projet LBC permet d’exploiter tout son 
potentiel, car la recherche par métadonnées permet d'obtenir des informations 
ciblées sur l'emploi des mots en fonction du contexte et du genre textuel, d’ex- 
traire de la terminologie et, non moins important, d'améliorer des compétences 
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en traduction et en langue étrangère. Nous avons en effet bien vu que, puisque 
le degré de technicité et de spécialisation des corpus comparables multilingues 
peut varier de la langue générale aux langues spécialisées, tant les chercheurs 
que les enseignants et les étudiants peuvent les employer comme des ressources 
complémentaires aux dictionnaires et à d’autres matériels linguistiques (cf. Za- 
nettin 1998). 

Dans la prochaine étape de notre recherche, centrée sur la création de bases 
parallèles de traduction de l'italien vers le francais des Vies de Georges Vasari, il 
sera possible de mettre en perspective les avantages offerts par les corpus compa- 
rables multilingues avec les points de force des corpus parallèles en diachronie. 
C'est à travers l'analyse des traductions publiées au cours des siècles que l’ évo- 
lution de la terminologie artistique en français sera mise en lumière. Elle pourra 
ainsi répondre aux nécessités en matière de traduction spécialisée multilingue 
et appréhender des savoirs d’un très vaste patrimoine historique et culturel, 
tout cela en continuité avec la vocation et les objectifs visés par les deux projets 
dans lesquels l’équipe LBC-CeSLiC de l’Université de Bologne est impliquée. 
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